یافتن مرکز بهینه برای خوشه ها در الگوریتم k-means

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر
نویسنده مهدی صادقیان
استاد راهنما احمد براانی
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1392

چکیده

چکیده داده کاوی به فرایند استخراج الگوهای پنهان و یا ویژگی های جالب و مفید از مجموعه داده ها گفته می شود که با استفاده از آن می توان به تصمیم گیری و پیش بینی رفتار آینده پرداخت. خوشه بندی در داده کاوی یکی از عملیات مهم در نتیجه گیری داده-کاوی بر روی داده ها به حساب می آید. خوشه بندی افراز بندی یک گروه متنوع به تعدادی زیر گروه مشابه یا گروه بندی مجموعه-ای از اشیاء به کلاسی از اشیاء مشابه می باشد، در هر خوشه باید داده هایی شبیه به هم قرار گیرند و کمترین شباهت را با داده-های موجود در دیگر خوشه ها دارا باشند. الگوریتم k-means یکی از روش های خوشه بندی است. در این الگوریتم ابتدا باید یک نقطه ی مرکزی برای هر خوشه انتخاب شود. یعنی در مرحله نخست باید k داده انتخاب شود که هر کدام معرف مرکز ابتدایی یک خوشه می باشند. سپس هر کدام از داده های باقیمانده در خوشه ای قرار داده می شود که بیشترین شباهت را به اعضائ آن داشته باشد. در ادامه، برای هر خوشه ی ایجاد شده بوسیله میانگین گیری از داده های آن خوشه، مرکز جدیدی بدست آورده و موقعیت هر داده برای خوشه های جدید محاسبه می گردد. این مرحله تا رسیدن به خوشه های قابل قبول ادامه می یابد. با مشخص کردن داده های مناسب برای مرکزهای اولیه خوشه ها می توان سرعت رسیدن به جواب نهایی را افزایش داد. برای یافتن مرکزهای اولیه بهینه بهتر است داده هایی انتخاب شوند که دارای تعداد همسایگی زیادی باشند. در روش پیشنهادی این پژوهش، برای یافتن داده های مناسب برای مراکز از بخش بندی (تقسیم) مجموعه داده ها استفاده شده است. در این روش مجموعه داده ها به تعداد خوشه مورد نیاز بخش بندی می شود. سپس میانگین هر کدام از این بخش های جدید به عنوان مراکز اولیه خوشه ها استفاده می شود. روش پیشنهادی باعث افزایش سرعت و دقت الگوریتم k-means می گردد. کلیدواژه ها: داده کاوی - خوشه بندی - مرکز خوشه ها – الگوریتم k-means

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

Customer classification using k-means algorithm for optimizing the transportation plans is one of the most interesting subjects in the Customer Relationship Management context. In this paper, the real-world data and information for a spare-parts distribution company (ISACO) during the past 36 months has been investigated and these figures have been evaluated using k-means tool developed for spa...

متن کامل

اصلاح خوشه بندی k-means توسط الگوریتم ژنتیک بهبودیافته

خوشه بندی تکنیکی از داده¬کاوی است که تعدادی آیتم را می¬گیرد و آنها را براساس ویژگیها¬یشان درون خوشه¬ها قرار می¬دهد. آیتمهای درون هر خوشه بیشترین میزان شباهت را در ویژگی بخصوصی که از پیش مشخص شده است،با هم دارند و آیتمهای خوشه¬های مختلف بیشترین تفاوت را در آن ویژگی، نسبت به هم دارند. خوشه¬بندی انواع مختلفی دارد که k-means یکی از بهترین و ساده¬ترین آنهاست. این خوشه¬بندی به این دلیل که پایه¬ی برخی...

بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)

خوشه بندی مشتریان با رویکرد داده کاوی برای بهینه سازی برنامه حمل ونقل یکی از مباحث مطرح در حوزه مدیریت ارتباط با مشتریان است. در این مقاله داده ها و اطلاعات واقعی توزیع قطعات یدکی شرکت ایساکو در طی 36 ماه گذسته مورد بررسی قرارگرفته است و به کمک ابزار داده کاوی شباهت رفتار تقاضای قطعات یدکی توسط مشتریان درمناطق مختلف کشور ایران سنجیده شده است. تابع سنجش شباهت رفتار مشتریان در مناطق مختلف براس...

متن کامل

خوشه بندی تصاویر پوشاک با استفاده از پردازش تصویر و الگوریتم K-means

امروزه صنعت پوشاک و مد صنعتی جهانی است و اکثر کشورها روی این صنعت سرمایه گذاری می کنند. در سالهای اخیر با گسترش تجارت الکترونیک و با توجه به مزیت های آن مثل قابل استفاده بودن کالاها با هزینه کمتر، انتخاب گسترده تر و صرفه جویی در زمان، انبوه مردم مایحتاج خود را از وبگاه ها و فروشگاه های اینترنتی به جای مغازه ها تهیه می کنند. این موضوع، نیاز به سامانه ای را ایجاد کرده که بتواند پوشاک را شناسایی و...

متن کامل

بهینه سازی سبدسهام با استفاده از روش k-means و الگوریتم ژنتیک

دیدگاهی که در این مقاله ارائه می دهیم در دو مرحله جای می گیرد: مرحله ی اول طبقه بندی سهم ها ی پورتفوی ابتدایی با روش k-means به دسته های کوچکتر است، سپس طبقه ای که کمترین ریسک و بیشترین بازده را دارد یا به عبارتی طبقه ای که بهینه تر می باشد را به عنوان ورودی الگوریتم خود که آن را MinVaRMaxR نامیده ایم برمی گزینیم. الگوریتم مذبور،الگوریتم پویایی، براساس الگوریتم ژنتیک و مفهوم ارزش در معرض خطر م...

متن کامل

بررسی و مقایسه الگوریتم فازی ‏‎(c-means)‎‏ و تحلیل خوشه ای ‏‎(k-means)‎‏ در بیمار عفونت ادراری

چون در اکثر رویدادها علم پزشکی بصورت غیرقطبی و مبهم با علائم فیزیولوژیکی بیان می شوند و این نوع مطالعات عموما مبهم و نادقیق هستند. در نتیجه برای بررسی این مفاهیم براساس نظریه های تئوریهای فازی و الگوریتم های آن که مهمترین آنها خوشه بندی فازی است استفاده می شود و از ویژگیهای مهم الگوریتم خوشه بندی فازی آنست که در ساختار الگوریتم فازی در خوشه بندی از تابع عضویت فازی استفاده می شود و یک فرد ممکن ا...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر

کلمات کلیدی

داده کاوی خوشه بندی مرکز خوشه

میزبانی شده توسط پلتفرم ابری doprax.com